BERICHTICTE 
FASSUNC* 




pr^HT weltorganisation for geisttges eigentum 

A ^ A Internationales Bttro - ■ 

INTERNATIONALE ANMELDUNG VEROFFENTUCHT NACH DEM VERTRAG OBER DEE 
INTERNATIONALE ZUSAMMEN ARBEIT AUF DEM GEBBET PES PATENTWESENS (PCT) 



(51) Internationale Patentklassifikation 6 : 
H04N 1700 



A2 



(11) Internationale VerofTentlichungsnummer: WO 99/12337 

ll.Marz 1999 (11.03.99) 



(43) Internationales 

Vero ffentlichungsdatum : 



(21) Internationales Aktenzeichen: PCT/EP98/O5460 

(22) Internationales Anmeldedatum: 28. August 1998 (28.08.98) 



(30) Prioritatsdaten: 
197 37 811.0 



29. August 1997 (29.08.97) DE 



(71) Anmelder (fur alle Bestimmungsstaaten ausser US)i OC£ 

PRINTING SYSTEMS GMBH [DE/DE]; Siemensallee 2, 
D-85586 Poing (DE). 

(72) Erfinder; und 

(75) Erfinder/Anmelder (nur fiir US): WEGENER, Harald 
[DEfDE]; St Ulrich Strasse 1, D-84149 Velden (DE). 

(74) Anwalte: SCHAUMBURG, Karl-Heinz usw.; Postfach 86 07 
48, D-8 1634 Munchen (DE). 



(81) Bestimmungsstaaten: CA, DE, JP, US, europaisches Patent 
(AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, 
LU f MC, NL, PT, SE). 



Veroffentlicfat 

Ohne internaxionalen Recherchenbericht und erneut zu 
veroffentlichen nach Erhalt des Berichts. 



(54) TiUe: METHOD AND DEVICE FOR ELECTRONIC ARCHIVING OF A COMPUTER DATA FLOW 

(54) Bezeichnung: VERFAHREN UND GERAT ZUR ELEKTRONISCHEN ARCHIVIERUNG EINES COMPUTER-DATENSTROMS 



—r 

Host 




jL 



14 



V 



Archiv 

ABCHIYE 




Viewer 



A. .. REFERENCE 

B. ..VMIABU DATA 



(57) Abstract 

The invention relates to a method and device for electronic archiving of a data flow (2) which contains graphic and/or text information 
and is outputted by a computer (2). The print data flow (5) is converted from a printer-specific data format into a pixel based data format 
(Bit map). Form data (8) is distinguished from variable data (9) in said pixel based data and both categories of data (8,9) are processed 
differently. r 



♦(Siehe PCT Gazette Nr. 20/1999, "Section ir) 




(57) Zusammenfassung 

Die Erfindung betrifft ein Verfahren und ein Gerat zur elektronischen Archivierung des von einem Computer (2) abgegebenen 
Datenstroms (5), der grafische und/oder Textinformationen enthaiL Der Druckdatenstrom (5) wird von einem druckerspezifischen 
Datenformat in ein auf Pixel basierendes Datenformat (Bit Map) umgesetzt Bei den auf Pixel basierenden Daten weiden Formular-Daten 
(8) von variablen Paten (9) unterschieden und diese beiden Datenarten (8, 9) jeweils unterschiedlich verarbeitet. 
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Verfahren und Gerat zur elektronischen Archivierung eines 
Computer-Datenstroms 

5 Die Erfindung betrif ft ein Verfahren und ein Gerat zur 
elektronischen Archivierung des von einem Computer 
abgegebenen Datenstroms nach dem Oberbegrif f des 
Patentanspruchs 1 . 

10 Ein solches Verfahren und ein solches Gerat sind aus der DE- 
4408327 Al bekannt. In Computern erzeugte Dokumente, die 
sowohl grafische als auch numerische und alphanumerische 
Inf ormationen enthalten, werden dabei liber eine 
Schnittstelle, beispielsweise eine Standard- 

15 Druckerschnittstelle, an ein Archivierungssystem ubertragen. 
Innerhalb des Archivierungssystems werden die zu den 
Dokumenten gehorenden Daten auf Massenspeichern wie 
Magnetbandern, magnetischen oder optischen Speicherplatten 
oder dergleichen langfristig aufbewahrt. Diese Art der 

20 Speicherung ersetzt in zunehmendem Mafie altere 

Verfahrensweisen, bei denen auf Papier vorliegende Dokumente 
bzw. Originale mit einem optischen Abtaster (Scanner) erfalit, 
das so erhaltene Bild in elektrische Signale umgewandelt 
wurden und dann in Archiven abgelegt wurden. Die fruher 

25 iibliche Microverf ilmung von Dokumenten wird durch diese neue 
Technik in zunehmendem Mafie ersetzt, wenn die Originale 
bereits in Form von elektronischen Signalen bzw. Computer- 
Datenstromen vorliegen. 

30 Elektronische Archivierungssysteme der eingangs genannten Art 
setzen einen vom Computer ausgegebenen Datenstrom in der 
Regel in einen Datenstrom mit spezif ischenw. an das Archiv 
angepafiten Datenformat -urn. In vielen Anwendungsf alien ist der 
Datenstrom des Computers an bestimmte Ausgabesysteme, 

35 insbesondere an Drucker, angepafit. Beispiele solcher 
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Druckdatenstrome sind das von IBM gepragte Format IPDS oder 
das von Hewlett Packard gepragte Datenformat PCL. 

Ein Archivierungssystem setzt diese DatenstrSme auf ein 
5 Format urn, welches dem Archivierungssystem entspricht. Die 
direkte Speicherung der vom Computersystem abgegebenen Daten 
erweist sich dabei als sehr nachteilig, weil dabei eine sehr 
grofie Anzahl an Systemparametern, z.B. Zeichenfonts, mit 
abgespeichert werden mufite. Auch die Reproduktion derart 
10 abgespeicherter Daten wQrde sich dann als sehr aufwendig 

erweisen. Archivierungssysteme speichern die Daten deshalb 
auf einer Pixel-orientierten Basis, z.B. im sog. TIF-Format, 
ab. Durch eine derartige, punktweise aufgebaute 
Speicherungstechnik eroffnet sich dann die M5glichkeit, das 
15 Datenvolumen nach gangigen Komprimierungsverf ahren zu 

verringern. Das Datenvolumen derart komprimierter Daten ist 
urn so grSfler, je mehr schwarz-weili Obergange zu verarbeiten 
sind. Andererseits werden Druckseiten in zunehmendem MaBe 
optisch immer aufwendiger gestaltet . Beispielsweise i. werden 
auf Formularen immer haufiger Grauraster hinterlegt, urn diese 
optisch ansprechender zu gestalten und Heryorhebungen besser 
kenntlich zu machen. Diese Entwicklung hat zur Folge, dali bei 
der Archivierung Druckseiten einen immer grdfieren 
Speicherbedarf haben. 



20 



25 



30 



In einem anderen, bekannten System, dem sog. COLD-System, 
werden Daten zur Archivierung getrennt als tiberwiegend 
grafische Daten und als tiberwiegend kodierte Daten 
(Zeilendaten) abgelegt. Bei erweiterten COLD-Verf ahren werden 
Rohdaten und Ressourcen ebenfalls getrennt abgelegt und bei 
der Reproduktion wird der gesamte Druckprozess nachgebildet . 
Dies bedingt eine komplexe Resourcen-Verwaltung. 



35 



Aus der DE 195 15 981 Al ist ein Verfahren zum Erfassen 
manuell beschriebener Belege bekanrit, bei dem die Belege 
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gescannt und anschliefiend unter Ausblendung von 
Vordruckinformationen an Bildschirmen weiterbearbeitet 
werden. Da die Vordruckinformationen bei der 
Weiterverarbeitung nicht mehr verfugbar sind, eignet sich 
5 dieses Verfahren nur dann, wenn die auf der Vorlage 
abgedruckten Inf ormationen zum Zeitpunkt der 
Weiterverarbeitung noch bekannt bzw. verfugbar ist. Fur ein 
langf ristiges Archivierungssystem ist dieses Verfahren 
deshalb kaum geeignet. 

10 

In der Verof f entlichung Wong, K.Y. et. al., ^Document 
Analysis System", in IBM J. Res. Develop., Vol. 26, No. 6, 
Nov. 1982, Seiten 647-656 ist ein Verfahren zur 
Unterscheidung zwischen Textdaten und graphischen Daten 
15 beschrieberi. Es eignet sich zum manuellen Bearbeiten von 
gescannten Dokumenten, ist aber fur die Archivierung von 
Druckdaten nicht ohne weiteres einsetzbar. 

Aufgabe der Erfindung ist es, ein System zur Archivierung von 
20 Computer-Datenstromen bereit zu stellen, bei dem ein hoher 
Datenkompressionsgrad erzielt werden kann, auch wenn 
aufwendige grafische Inf ormationen archiviert werden sollen. 



Diese Aufgabe wird durch die im Patentanspruch 1 und im 
25 Patentanspruch 15 beschriebene Erf indung gelost. Vorteilhafte 
Ausfuhrungsf ormen der Erfindung sind Gegenstand der 
Unteranspruche . 

Die Erfindung beruht auf der Erkenntnis, daB ein Groiiteil der 
30 zu archivierenden Computer-Datenstrome, insbesondere an 
Drucker zugeftihrte Datenstrbme, aus zweierlei Datenarten 
besteht. Einerseits sind in diesen Druckdaten haufig 
Formulare hinterlegt, die fur eine bestimmte Anzahl 
zusammengehoriger Druckdatensatze, sog. Jobs, in ein und 
35 derselben Weise wiederkehren. Andererseits sind diese 
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Formulare mit variablen Daten gefiillt, welche jeweils das 
Charakteristische eines Dokuments darstellen. Erf indungsgemafi 
wurde erkannt, dafi der durch Formulare hervorgeruf ene Anteil 
an. komprimiertem Druck-Datenstrom oft denjenigen Anteil 
5 Gberwiegt, der durch die variablen Daten hervorgeruf en wird. 
Erf indungsgemafi werden deshalb diejenigen Daten, die von 
Formularen stammen, von denjenigen Daten, die variabel sind, 
getrennt, und die beiden Datenarten jeweils getrennt auf Bit- 
Map-Basis, insbesondere komprimiert , weiterverarbeitet . 

10 Innerhalb des Archivierungssystems werden diese Daten 

voneinander getrennt abgespeichert und spater zum Betrachten 
wieder zusammengef uhrt ; dies kann insbesondere Pixel-genau 
erfolgen. Fur eine Gruppe zusammengehorender Daten (Job) 
werden die Daten eines Formulars nur einmal abgelegt. Bei „den 

15 einzelnen Dokumenten werden die zugehorigen variablen Daten 
mit dem Formular nur noch in der Weise verkniipft, dafi ein 
Verweis.. auf den entsprechenden Speicherbereich des Formulars 
abgelegt wird. Vorteilhaft ist dabei, dafi sich die - in der 
Regel umfangreiche Datenmenge eines Formulars - fur jeden Job 

20 auf ein einmaliges Abspeichern des Formulars beschrankt. 

Hierdurch wird eine betrachtliche Speicherplat zeinsparung - 
gegenuber Systemen des Standes der Technik erzielt. 

Bei Druckgut mit hoher Auflage, d.h. mit haufig 
25 wiederkehrenden, gleichartigen Formularen, wird hierdurch ein 
hoher Grad an Speicherplatzeinsparung erreicht. 

Vorteilhaft ist weiter, - insbesondere gegenuber dem o.g. 
COLD-Systemen - dafi sich die Reproduktion der Daten sehr 
30 einfach gestaltet, well auf Bit-Map-Basis (z.B. TIF-Format) 
nur ein Viewer zur Reproduktion benotigt wird 
(selbsttragendes Format) . 

Als vorteilhaft erweist es sich auch, zusammen mit den 
35 Verweisen eine Information abzuspeichern, die ein genaues 
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Zusammenfuhren der Formulardaten mit den zugehorigen, 
variablen Daten ermoglicht . 

In einer weiteren, vorteilhaf ten Ausf uhrungsf orm der 
5 Erfindung werden die Formular-Daten je Job # d.h. je 

zusammenhangendem Datenstrom, nur einmal im Archivspeicher 
als Bit Map abgespeichert, wahrend die variablen Daten jedes 
Dokuments des Jobs jeweils einzeln abgespeichert werden. 

In einer auf extrem hohen Komprimierungsgrad ausgerichteten 
Ausfuhrungsform werden die Formulardaten inhaltlich reduziert 
Oder sogar ganzlich unterdriickt. In einem derartigen System 
wurden dann im Archivspeicher nur noch die variablen Daten 
abgespeichert. . . 

Eine Unterscheidung zwischen Formulardaten und variablen 
Daten erfolgt vorzugsweise im druckerspezif ischen 
Datenformat, d.h. bevor der Druckdatenstrom bzw. die 
betroffenen Telle davon in das pixelbasierte Datenformat 
umgesetzt werden. Dabei ist es insbesondere giinstig, 
Formularindikatoren zur Erkennung von Formular-Daten zu 
verwenden wie beispielsweise die in IPDS-Druckdatenstromen 
ublichen Overlay-Daten oder in PCL-Druckdatenstromen Makros, 
formularspezif ische Grafiken wie grau hinterlegte Rechtecke 
oder dergleichen. Dabei muli nicht zwangslaufig ein gesamtes, 
einer Seite entsprechendes Formular gesucht und gefunden 
werden. Erf indungsgemafi kann bereits durch das Erkennen 
einzelner Formularbestandteile ein hoher Grad an 
Speicherplatzeinsparung erzielt werden. Auf jeder Seite 
konnen mehrere Bestandteile auftreten. 

Werden Formularindikatoren verwendet, so kann eine hohe 
Performance beim Archivieren erreicht werden , weil 
Formulardaten bzw. ,-strukturen relativ einfach bzw. 
35 eindeutig erkennbar sind. Dabei kann es vorteilhaf t sein, 
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Formularindikatoren relativ restriktiv einzusetzen, wobei 
Formulardaten nur dann als solche bezeichnet werden, wenn mit 
relativ einfachen Beurteilungskriterien sicher ist, dafi die 
entsprechenden auf Pixelbasis umgesetzten Daten pixelgenau 
5 iibereinstimmen . Zur Perf omancesteigerung wahrend des 

Archivierungsprozesses kann auch beitragen, wenn fur die zu 
erkennenden Formulardaten eine MindestgrdJSe vorgesehen ist. 
Sehr kleine Bildelemente in einem Druckdatenstrom werden dann 
nicht der Prozedur zur separaten Rasterung und einer 
10 Zwischenspeicherung zugefuhrt sondern gemeinsam mit den 
variablen Daten gerastert und gespeichert. 

Bel der Suche der Daten in dem Archivspeicher bzw. bei der 
Rekonstruktion des urspriinglichen Datenstroms konnen die - 
15 Formulardaten mit den Inhaltsdaten entweder automatisch 
uberlagert werden anhand von Steuerungssignalen (Fig. 1/ 
Verweis) oder aber variable Daten und Formulardaten get rennt 
voneinander geladen und vom Bediener gesteuert Qbereinander 
gelegt werden. 

20 

Im Zuge des Archivierens konnen neben den variablen Daten und 
den Formulardaten sog. Index-Daten erzeugt werden, in denen 
Suchkriterien abgespeichert werden, sowie die Verweisdaten 
auf die Speicherorte der variablen Daten und gegebenenf alls 
25 der Formulardaten. 

In einer weiteren, vorteilhaf ten Ausftihrungsf orm der 
Erfindung erfolgt der Datentibertrag zura Computersystem in das 
Archivsystem iiber einen Drucker-Controller, welcher mit einem 
nachgeschalteten Computer zusammenarbeitet . Der Druck- 
Cpntroller kann dabei also sowohl zum Erzeugen eines 
Pixeldatenstroms zur Ansteuerung eines Druckers, als auch zum 
Erzeugen eines Archiv- Datenstroms verwendet werden. Die 
beiden Datenstromverbindungen kSnnen insbesondere zeitlich 
35 parallel erfolgen, wodurch eine hohe Geschwindigkeit des 
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Gesamtprozesses (Drucken und Archivieren) erreichbar ist. Vom 
Controller zum Computer erfolgt der Datentransfer sowohl fur 
die Formular- und variablen Daten des punktorientierten 
Datenformats (Bit Map) als auch die im zeichendrientierten 
5 (ASCII-Format) Indexdaten tiber eine gemeinsame Schnittstelle. 

Die Verkntipfung, d.h. der Verweis von den variablen Daten zu 
den Formulardaten, kann innerhalb des variablen Datensatzes 
hinterlegt werden, innerhalb des entsprechenden Index- 
10 Datensatzes oder in beiden Datensatzen. 

Weitere Vorteile und Wirkungen der Erfindung werden anhand 
der nachfolgend beschriebenen Ausf uhrungsbeispiele deutlich, 
die im Zusammenhang mit zwei Figuren beschrieben werden. 

15 

Es zeigen: 

Figur 1: ein elektronisches Archivierungssystem, 
20 Figur 2: elektronische Komponenten des Archivierungssystems, 

Figur 3: einen Ablauf zum Erkennen und Trennen der 
verschiedenen Datentypen in einem Druckdatenstrom, 

25 Figur 4: einen Ablauf zum Archivieren von getrennt 
abgespeicherten Daten und 

Figur 5: einen Ablauf zum Drucken eines vorab getrennten ' 
Druckdatenstroms • 

30 

Bei dem in Figur 1 dargestellten elektronischen 
Archivierungssystem wird der von einem Host-Computer 2 
abgegebene Datenstrom tiber eine Archivierungs-Schnittstelle 1 
an einen Archiv-Speicher 3 abgegeben. Der Archiv-Speicher 3 
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kann insbesondere ein GerSt zum Beschreiben von Laser- 
Speicherplatten sein. Die im Archivspeicher 3 gespeicherten 
Daten kGnnen in dem Bit-Map-basierten Datenformat mit einem 
Lesegerat (Viewer) 4 abgerufen und beispielsweise wiederum 
5 auf einem Computerbildschirm dargestellt werden. 

Der vom Host-Computer abgegebene Datenstrom 2 wird uber eine 
Standard-Druckerschnittstelle in einen Controller 6 
(ISTREAM) eingespielt. Diese Daten sind in Form sog. Jobs 

10 gruppiert. Ein Job ist ein zusammenhangender Datenstrom, der 
in irgendeiner Weise (logisch oder physikalisch) miteinander 
verknupft ist. Innerhalb des Host-Computers kann 
beispielsweise eine Marke von aulien zugefuhrt werden, die 
bestimmte Druck-Datenstrome miteinander zu einem Job : 

15 verbindet. 

Innerhalb der Archivierungs-Schnittstelle werden die vom 
Host-Computer gelieferten Daten 5 klassif iziert nach 
variablen Daten 9 und Formular-Daten 8. Die Formular-Daten 
20 (z.B. Overlays) stellen dabei einen f ixen -Anteil des Jobs 
dar, der auf mehreren Druckseiten des Jobs unverandert 
auftritt. Die variablen Daten sind dagegen- innerhalb' eines 
Jobs von Druckseite zu Druckseite unterschiedlich. 

25 In der Archivierungs-Schnittstelle werden nunmehr ftir jeden 

Job die Formulardaten 8 fur jedes Forrnular nur jeweils einmal 
hinterlegt, wahrend die variablen Daten seitenweise 
hinterlegt werden. Gleichzeitig werden Index-Daten erzeugt, 
die zu den variablen Daten bestimmte Zusatzinf ormation 

30 enthalten, beispielsweise herausgegrif f ene Ordnungsnummern, 

Namen, Stichworte oder dergleichen. Die Index-Daten werden im 
Zuge der weiteren Verarbeitung in Form einer Datenbank 
weiterverarbeitet und ermoglichen dem spateren Benutzer des 
Archivs, bestimmte Datensatze wiederzuf inden . Die Index-Daten 

35 enthalten fur alle variablen Datensatze Verweis-Inf ormationen 
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11 , welche die Zuordnung bzw. das Wiederfinden der variablen 
Daten 9 ermoglichen. 

Urn alle variablen Daten einer Druckseite auch mit dem 
5 zugrundeliegenden Formular-Datensatz 8 zu verbinden, mufi ein 
Verweis zwischen variablen Daten und Formular erfolgen. 
Dieser kann entweder direkt als Verweis 12 oder indirekt Aiber 
den Index-Datensatz 10 als indirekter Verweis 13 erfolgen. 
Zur Sicherheit konnen auch alle drei Verweisarten 11, 12* und 
10 13 gemeinsam fur jede Druckseite hinterlegt werden. Die so 
erzeugte Datenstruktur 7 wird dann uber eine geeignete 
Verbindung dem Archiv-Speicher 3 zugef uhrt . 

Die Formular-Daten 8 und die variablen Daten 9 sind.- .genauso 
15 wie die Archiv-Daten - innerhalb einer Bit Map-Datendomane 
14, wahrend die Index-Daten in einera kodierten Format, z.B. 
ASCII vorliegen. 

Figur 2 zeigt eine Ausf iihrungsf orm fur eine erf indungsgemafie 
20 Archivierungs-Schnittstelle 1. Sie ist unterteilt in einen 

Drucker-Controller 6 und einen nachgeschalteten Computer 15, 
welcher beispielsweise ein Personal Computer (PC) sein kann. 

Die vom Host-Computer 2 gelieferten Daten werden uber einen 
25 Kanalanschluli 16 eingespeist. Von diesem werden sie in einem 
Zwischenspeicher 17 zwischengespeichert . Aus diesem Speicher 
werden die Daten sukzessive von einer Rastersteuerung 18 
entnommen, die die Druckdaten in ein Bit Map Muster umsetzt. 
Die Rastersteuerung 18 verfiigt * hierzu uber einen nicht naher 
30 gezeigten Speicher, welcher Rasterinformationen zur Umsetzung 
der Druckdatensprache in die entsprechenden Bit Map 
Inf ormationen enthait. Die Rastersteuerung 18 unterscheidet 
innerhalb eines zusammengehorenden Druckjobs Formulardaten 
von variablen Daten. Gleichzeitig produziert sie zu jedem Job 
35 einen Index-Datensatz, welcher zur Verwaltung der zu 
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archivierenden Daten dient. Die Rastersteuerung 18 speichert 
die variablen Daten in einem variablen Datenspeicher 19, die 
Formulardaten in einem Formulardatenspeicher 20 und die 
Index-Daten in einem Index-Datenspeicher 21 ab. Diese drei 
5 Speicher 19, 20 und 21 sind Bestandteil des fltichtigen 
Arbeits-Bildspeichers 22, des Controllers 6. Die in den 
Datenspeicher 19, 20 und 21 erzeugten Daten werden dann tiber 
eine gemeinsame Schnittstelle 23 an den nachgeschaltenen 
Personal Computer 15 iibertragen. Den Datentransf er steuert 
10 eine Gesamtsteuerung 24 des Controllers 6, welche mit einer 
Bedienoberflache und Steuerung 25 des Personal Computers 15 
verbunden ist. 

Die Rastersteuerung 18 behandelt Formular-Daten und variable 
15 Daten unterschiedlich. Fur Formulardaten werden eigene Bit 
Maps im Formularspeicher erzeugt. Fur die variablen Daten 
werden im Speicher 19 Bit Maps erzeugt, die keine Formular- 
Daten (Overlays) enthalten. 

20 Die Index-Daten, welche im Index-Speicher 21 abgelegt werden, 
enthalten Verwaltungsinf ormationen, welche u.a. fur jede 
Seite des Druckjobs die verwendeten Formular-Overlays ablegt. 
Dabei wird auch'der Bezug zwischen variablen Daten und 
Formular-Daten hergestellt. 

25 

Innerhalb des Personal Computers 15 werden die aus dem 
Speicher fur variable Daten 19 und dem Speicher fur 
Formulardaten 20 stammenden Daten in einer 

Komprimierungsstufe 26 komprimiert. Die Index-Daten werden 
30 vorzugsweise ohne Kompression in einer Index-Warteschlange 27 
zwischengespeichert, bis sowohl variable als auch 
Formulardaten die Komprimierung durchlaufen haben. Im 
Anschlufi an die Komprimierungsstufe 26 sind zwei parallel 
geschaltete Warteschlangen 28, 29 fur die variablen Daten und 
35 far die Formular-Daten vorgesehen, in denen die 
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entsprechenden Daten so lange zwischengespeichert werden, bis 
die zugehorigen iibrigen Daten die Komprimierungsstuf e 
ebenfalls durchlaufen haben. 

5 Die in den, Warteschlangen 27, 28 und 29 befindlichen Daten 
werden dann von einer Synchronisierungsstuf e 30 gemeinsam 
entnommen und liber eine Netzwerksteuerung 31 zur 
Ausgabeschnittstelle 32 in Richtung zum Archivspeicher 3 
abgegeben. " 

10 

In einer weiteren vorteilhaf ten Ausf iihrungsf orm konnen alle 
Verarbeitungseinheiten des Personal-Computers 15 auch in dem 
Drucker-Controller integriert sein* 

15 In Figur 3 ist ein Ablauf diagramm dargestellt, das einen 

Ablauf zur Analyse von Druckdaten darstellt . In einem ersten 
Schritt SI wird jeweils eine Gruppe von Druckdaten aus dem 
Druckdatenstrom 5 in einen vorgegebenen Bereich des, 
Controllers 6 eingelesen. Der Umfang der Gruppe kann 

20 individuell bestimmt werden, wobei eine Druckseite 

beispielsweise in 2, 5, 10 oder noch mehr Teilbereiche . 
unterteilt sein kann. Die nachfolgende Analyse der Druckdaten 
erfolgt im sog. CI-Raum (Coded Information Raum) . Die Analyse 
erfolgt dabei so, dafi die Auswirkungen der Datenumsetzung auf 

25 Pixel-basierter Basis, d.h. im sog. NCI-Raum (Non-Coded 
Information Raum) beriicksichtigt werden. Dazu wird der 
Druckdatenstrom bzw. die Gruppen der Druckdaten nach gewissen 
Kategorien auf Formularindikatoren untersucht. Ein erster 
Formularindikator, der beispielsweise in Druckdatenstromen 

30 nach dem IPDS-Format haufig verwendet wird, sind sogenannte 
Overlay-Daten oder Overlay-Auf ruf e. Liegen solche Overlay- 
Daten oder ein Overlay-Auf ruf vor, so ist dies ein Hinweis 
darauf, daft den Daten ein Formular zugrunde liegt. Die 
Overlay-Daten bzw. der Overlay-Auf ruf werden dann gemaB 

35 Schritt S7 weiterverarbeitet , der weiter unten noch naher 
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12 

beschrieben wird. Bei Overlays und Makros wird 
sinnvollerweise der jeweilige Aufruf ausgewertet, da ein 
definiertes Overlay oder Makro nicht notwendigerweise auch 
verwendet wird. Wurde ein Overlay also bereits einmal 
aufgerufen, so wird bei jedem spateren Aufruf dieses Overlays 
im Schritt S7 der Status „ja" ausgegeben. 

Die Untersuchung der Druckdaten kann relativ restriktiv 
erfolgen, d.h. Formularindikatoren nur dann als gegeben 
betrachtet werden, wenn sie relativ eindeutig darauf 
hinweisen, dafi ein Formular vorliegt, d.h. dafi die 
entsprechenden Daten innerhalb eines Druckjobs, der eine 
Vielzahl von Seiten enthalt, . mehrmals vorkommen. • " 



15 Wurde im Schritt S2 kein Overlay f estgestellt, so wird im 
Schritt S3 untersucht, ob in der aktuellen Gruppe von 
Druckdaten Makro- Informationen vorhanden sind, ggf. wird das 
jeweilige Makro hinsichtlich typischen Makro- 
Formularindikatoren im Schritt SI 3 uberpruft. In der 

20 Drucksprache PCL werden haufig wiederkehrende Aktionen 
regelmaliig in Makros abgelegt . Somit ist die 
Wahrscheinlichkeit, bei der Untersuchung von Makros auf 
konstante Daten mit Formelcharakter, beispielsweise auf 
Felder mit grau hinterlegtem Hintergrund zu stolien. 

25 Gegebenenfalls wird im Schritt S6 eine Variable, die den 
Formelindikator reprasentiert auf 1 (ja) gesetzt und die 
entsprechende Druckdatengruppe im Schritt S7 weiterbehandelt , 



Wie im Schritt S3 werden Daten, die kein Makro enthalten, 
auch im Schritt S4 hinsichtlich graphischen Objekten 
untersucht. Auch hier sind beispielsweise mit Graurastern 
gefullte Flachen im Schritt S14 erkennbar und wiederum mit 
dem Schritt S6 als Formularbestandteil zu kennzeichnen. 
Insbesondere werden gefullte Rechtecke meist durch einfach zu 
35 erkennende Strukturen in entsprechenden Drucksprachen 
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beschrieben. Auch kleinere Bit-Maps in bestimmten Bereichen, 
z.B. ein Firmenlogo, auf den Druckseiten konnen lohnenswerte 
Objekte sein, die als Formularbestandteil gekennzeichnet 
werden konnen. 

Ergibt auch Schritt S4 kein Formular-Ergebnis, so kann in 
einem Schritt S5 gepruft werden, ob in den aktuellen 
Druckdaten typische, haufig wiederkehrende Textbestandteile 
vorhanden sind. Bei dieser Prtifung kann u.U. restriktiver 
vorgegangen werden, wenn die Textdaten zu einem hohen Grad 
individualisiert sind. Sind jedoch solche Textdaten eindeutig 
als Formularbestandteile in Schritt S15 ermittelt, so wird 
auch hier der Schritt S6 zum Schritt S7 fiihren. 

Textobjekte sollten ebenfalls nur in bestimmten Bereichen 
einer Seite, z.B. in der FuBzeile auf konstante Anteile 
untersucht werden. Dabei konnen beispielsweise auch 
Schrif tattribute untersucht werden. Beispielsweise deutet 
eine SchriftgroBe < 10 pt darauf hin, daB eine Information 
eine Formularinf ormation ist. 

Wurde im Schritt S6 ein. Formularindikator entdeckt, so wird 
im Schritt S7 gepruft, ob diese (im NCI-Raum identische) 
Struktur bereits fruher aufgetreten ist. Wenn diese Bedingung 
25 nicht erfullt ist, so wird im Schritt S17 die aktuell 
aufgetretene Struktur in einem Strukturspeicher 40 
abgespeichert . Die Daten werden sodann im Rahmen des normalen 
Rasterprozesses im Schritt S9 in der Bit-Map 19a fur variable 
Daten im Rahmen des normalen Rasterprozesses S9 abgelegt. 

30 

Wird im Schritt S7 dagegen f estgestellt , daB im Speicher 40 
bereits eine Struktur gespeichert ist, die den aktuellen 
Daten entspricht, so wird im Schritt S18 gepriift, ob die 
konstanten Daten bereits bei einer vorhergehenden Seite 
35 aufgerastert wurden und somit schon als Bitmap vorliegen. In 
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diesem Fall konnen im Schritt S12 direkt Referenzen zwischen 
den in den Bitmaps 20a, 20b, 20c gespeicherten konstanten- 
Daten und den jeweils zugehorigen variablen Daten gebildet 
werden. Bei dieser Ref erenzbildung wird der Speicherort der 

5 Bitmaps im Festspeicher 20 und der Ort der Bitmap beziiglich 
der Druckseite (sog. xy-Position) in einer Ref erenztabelle 41 
festgehalten. Falls die konstanten Daten noch nicht 
aufgerastert sind, werden diese Daten in einem eigenen 
Rasterprozefi fur konstante Daten im Schritt S8 gerastert und 

0 in einer Bit-Map fur konstante Daten jeweils separat als" Bit- 
Map 20a, 20b, 20c usw. abgespeichert . 



Nachdem die Schritte S18, S8, S9 und S12 abgeschlossen sind, 
wird im Schritt S10 iiberpruft, ob die aktuellen Daten ein 
15 Seitenende markieren,\ wenn nicht, werden mit Schritt SI die 
nachsten Druckdaten eingelesen. 1st das Seitenende erreicht, 
so wird im Schritt Sll eine logische Statusvariable auf einen 
Wert „TRUE XA gesetzt. 

20 Beim erstmaligen Auftreten einer Struktur mit 

Formularindikator wird diese Struktur lediglich im Coded- 
Format im Strukturspeicher 40 abgespeichert. Durch dieses 
Verfahren werden nur Strukturen, die wiederholt vorkommen, 
einer Sonderbehandlung unterworfen. Beim erstmaligen 

25 Auftreten einer solchen Struktur werden die entsprechenden 
Daten zunachst immer als variable Daten interpretiert . 

Bei bestimmten Ereignissen bzw. Kommandos innerhalb des 
Druckdatenstroms (z.B. beim Beginn eines neuen Druckjobs, bei 
30 einem Printer-Reset oder dergl.) werden die auf getretenen 
Strukturen im Strukturspeicher 40 geloscht. 

Beim wiederholten Auftreten einer im NCI-Raum identischen 
Struktur wird dieses im Schritt S12 in der Ref erenztabelle 41 
35 vermerkt* 
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In Figur 4 ist der Ablauf zum Archivieren der zuvor gemafi 
Figur 3 verarbeiteten Druckdaten beschrieben. Im Schritt S20 
wird zunachst gepruft, ob die Seitenende-Statusvariable (vgl. 
Schritt Sll), auf „TRUE" gesetzt ist. 1st diese Bedingung 
5 erfiillt, so werden die im Schritt S9 bzw. in Bit-Map. 19a 

gespeicherten, variablen Daten im Schritt S21 komprimiert und 
danach im Schritt S22 Verweise zu konstanten Daten .anhand der 
Referenztabelle 41 gebildet und abgelegt. 

10 Im Schritt S23 wird dann gepruft, ob zu den in Schritt S22 
gebildeten Verweisen bereits konstante Daten im 
Archivspeicher abgelegt sind. Wenn dies nicht der Fall ist, 
so werden die entsprechenden konstanten Daten aus den Bit- 
Maps 20a, 20b, 20c usw. unter Verwendung der Referenztabelle 

15 41 im Schritt S24 komprimiert und die komprimierten Daten im 
Schritt S25 im Archivspeicher abgelegt, 

Wird dagegen im Schritt S23 f estgestellt , dafi im 
Archivspeicher bereits entsprechende Daten komprimiert 
20 abgelegt sind, so werden im Schritt S26 nur noch die 

aktuellen variablen Daten komprimiert und im Archivspeicher 
abgelegt. Danach wird im Schritt S20 der nachste Datensatz 
behandelt, bis alle ankommenden Daten verarbeitet sind. 

25 Die variablen Daten werden in einem separaten Speicher 

aufgerastert und komprimiert. Beim Abspeichern der variablen 
Daten werden die Verweise, insbesondere diejenigen auf den 
XY-Offset innerhalb der Seite sowie diejenigen auf den 
Speicherort, der auf der Seite enthaltenen konstanten Daten 

30 hinzugefiigt . 

In Figur 5 ist der ProzeB zum Druckern der gemafi Figur 3 
verarbeiteten Daten dargestellt. Im Schritt S30 wird wiederum 
iiberpriift, ob alle Daten einer Seite abgearbeitet sind, d.h. 
35 ob in Schritt Sll von Figur 3 die Variable zum Seitenabschlufi 
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auf „TRUE" gesetzt ist. 1st dies der Fall/ so kann zum " 
Drucken in Schritt S31 die in Speicher 19 gespeicherte Bit- 
Map 19a der variablen Daten einer Seite mit den 
entsprechenden Bit-Maps 20a, 20b, 20c der konstanten Daten 
5 der zugeherigen Seite anhand der Ref erenztabelle 41 

uberlagert werden. Dies kann beispielsweise durch eine 
logische „0DER"-0peration zwischen dem entsprechenden Bit-Map 
geschehen. Anschlieftend kann in Schritt S32 der Druckvorgang 
gestartet werden. 

10 

Ausgehend von dem in Figur 3 dargestellten Verfahren zur 
Untersuchung der Daten konnen die Prozesse der Figuren 4 und 
5, d.h. Archivieren und Drucken, parallel erfolgen. 

15 Es wurden Ausf tihrungsbeispiele der Erfindung beschrieben. 
Dabei ist klar, daJJ ohne weiteres Abwandlungen und 
Weiterentwicklungen der Erfindung angegeben werden konnen. 
Beispielsweise kann in einem Druck- und Archiviersystem 
vorgesehen sein, dali der Anwender bzw. das Anwendungsprogramm 

20 bereits beim Erzeugen des Datenstroms immer wiederkehrende 
Daten (Formulardaten) mit besonderen Kennzeichnungen 
yersieht, (z.B. durch eine entsprechende Steuerinf ormation) 
und dafi diese Kennzeichnungen im spSteren Archivier- bzw. 
Druckvorgang entsprechend ausgewertet werden. Ahnlich wie bei 

25 der Overlay-Information kann damit eine sichere Entscheidung • 
getroffen werden, dafi bestimmte Daten Formulardaten sind. 

Es kann auch vorteilhaft sein, im Datenauf bereitungsprozefi 
(Fig. 3) nach dem Rastern der konstanten Daten im Schritt S8 
30 gleich die Schritte S24 und S25 durchzuf uhren und die 

konstanten Daten im Archivspeicher abzulegen. Hierzu mussen 
aber die Ablagearten der Daten fruhzeitig bekannt sein. 
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Patentanspriiche 

1. Verfahren zur elektronischen Archivierung des von einem 
5 Computer (2) abgegebenen Datenstroms (5) , der grafische 

und/oder Textinf ormationen enthalt, wobei der Datenstrom(S) 
von einem druckerspezif ischen Datenformat in ein auf Pixel 
basierendes Datenformat (Bit Map) umgesetzt wird, dadurch 
gekennzeichnet, dafi bei den auf Pixel basierenden Daten 
10 Formular-Daten (8) von variablen Daten (9) unterschieden 
werden und dali diese beiden Datenarten (8, 9) jeweils 
unterschiedlich verarbeitet werden* 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dafi den 
15 variablen Daten (9) Verweise zu den Formulardaten (8) 

zugeordnet werden. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, 
da/5 innerhalb einer vorgegebenen Datengruppe (Job) ein 

20 Formular-Datensatz gleichartiger Formulardaten nur einmal 
abgespeichert wird, wahrend die zugeordneten variablen 
Daten aller Datensatze der Datengruppe (Job) jeweils alle 
gespeichert werden. 

25 4. Verfahren nach einem der Anspruche 1 bis 3, dadurch 
gekennzeichnet, dafi eine Unterscheidung zwischen 
Formulardaten (8) und variablen Daten (9) im 
druckerspezif ischen Datenformat erfolgt. . 

30 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daB im 
Datenstrom (5) Formularindikatoren zur Erkennung von 
Formular-Daten (8) gesucht werden. 



35 



6. Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet, 
dafi die Daten des Datenstroms (5) gruppenweise zunachst auf 



WO 99/12337 



PCT/EP98/05460 



18 

Formularindikatoren untersucht werden und nur bei 
wiederholtem Auftreten von Formulardaten (8) die Zuordnung 
zwischen den variablen Daten (9) und den Formulardaten (8) 
erf olgt . 

7^ Verfahren nach Anspruch 6, dadurch gekennzeichnet, da-fi als 
Formularindikatoren Overlay- Inf ormationen, besondere 
St euerinf ormationen, Makro-Inf ormationen, graphische 
Informationen, vorgegebene Textbausteine und/oder 
vorgegebene Textattribute verwendet werden. 

8. Verfahren nach einem der Anspriiche 4 bis 7, dadurch 
gekennzeichnet, dafi ein Formular-Datensatz nach dem ersten 
Auftreten innerhalb der vorgegebenen Datengruppe (Job) des 
Druckdatenstroms (5) abgespeichert wird und erst nach 
wiederholtem, insbesondere zweitem Auftreten als 
Formulardatensatz markiert, in eine Forrnular-Bit-Map (20a, 
20b, 20c) umgesetzt und dem zugehorigen variablen Datensatz 
(9) zugeordnet wird. 

9. Verfahren nach einem der vorhergehenden Anspriiche, \ dadurch 
gekennzeichnet, daft innerhalb eines Arbeitsablauf es 
wahlweise entweder gedruckt oder archiviert, oder 
gleichzeitig gedruckt und archiviert wird. 

10. Verfahren nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, dafi die Formulardaten im 
Archivspeicher (3) nicht abgespeichert werden. 

11. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, daft- das ursprungliche . Pixelbild aus den 
Formular-Daten (8) und den variablen Daten (9) 
rekonstruiert wird. 



WO 99/12337 



PCT/EP98/05460 



19 

12. Verfahren nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, daB unter Verwendung der Verweise eihe 
Oberlagerung der Formular-Daten (8) und der variablen 
Daten (9) erfolgt. 

5 

13. Verfahren nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, daB ein Index-Datensatz erzeugt wird. 

14. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
10 gekennzeichnet, daB der Index-Datensatz einen Verweis auf 

die variablen Daten (9) , insbesondere auf die Formular- 
Daten (8), enthalt. 

15. Gerat zur elektronischen Archivierung des von einem 
15 Computer abgegebenen Datenstroms (5) , der grafische 



und/oder Textinformationen enthalt, wobei der 
Druckdatenstrom (5) von einem druckerspezif ischen 
Datenformat in ein auf Pixel basierendes Datenformat (Bit 



20 



Map) umgesetzt wird, dadurch gekennzeichnet, daB eine 
Archivierungs-Schnittstelle (1) vorgesehen ist, die im auf 
Pixel basierenden Datenformat Formular-Daten (8) und 
variable Daten (9) unter schiedlich verarbeitet. 



25 



16.Gerat nach Anspruch 15, gekennzeichnet durch einen 
Drucker-Controller (6), der iiber eine Schnittstelle 
variable Daten (9), Formular-Daten (8) und Index-Daten 
(10) an einen Weiterverarbeitungscomputer (PC) iibergibt. 



30 



17.Gerat nach Anspruch 16, bei dem die Verarbeitungs- 

einheiten des Weiterverarbeitungscomputers (PC) in den 
Drucker-Controller integriert sind. 



18.Gerat nach Anspruch 15 bis 17, dadurch gekennzeichnet, 

daB in der Archivierungs-Schnittstelle (1) Formular-Daten 



WO 99/12337 




PCT/EP98/05460 



20 

(8) und variablen Daten (9) unterschieden werden. 

19.Gerat nach einem der Anspriiche 15 bis 18 dadurch 
gekennzeichnet, dafi zur Unterscheidung zwischen 
Formulardaten (8) und variablen Daten (9) der Datenstro 
(5) im druckerspezif ischen Datenformat untersucht wird. 
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